Объект изучения, исследуемый при помощи статистических методов, направленных на анализ:
1) употребительности языковых фактов с точки зрения их нормативности;
2) принадлежности стилю языка;
3) принадлежности стилю отдельного автора. Выборки должны быть однородными и одинакового объема или длины. При использовании лингвостатистических методов исследователь оперирует средними частотами и частотностью (долями), понимаемой как отношение наблюдаемой частоты к длине. Статистическая методика заменяет полное обследование текста серией выборок - наблюдений (выборочная частота обозначается знаком х с показателем выборки: х1, х2, наблюдение - знаком ni). Средняя частота х есть отношение суммы (знак суммирования) всех выборочных частот к числу выборок: . Средняя частота отличается от выборочных частот, поэтому статистическая интерпретация предполагает обобщение отклонения средней частоты от выборочных частот. Усредненная мера отклонения от средней частоты в математической статистике и теории вероятностей называется дисперсией и обозначается буквой σ. Дисперсия - среднее арифметическое из квадрата отклонений величин x от их среднего арифметического, т.е. от средней частоты. или . Среднее квадратичное отклонение есть квадратный корень из дисперсии. Статистически изучаются и выборочные частоты, и частотные доли. Доля как отношение наблюдаемой частоты к длине выборки определяется при помощи формулы вероятности: р = m/n, где р - доля. Статистическое сравнение долей изучается при помощи вычисления квадратичного отклонения доли, критерия xu -квадрат и критерия Стьюдента. Распределение частот и частотных долей в тексте того или иного автора дает возможность выявить постоянные (константные) особенности текста, а также индивидуальные (случайные) особенности, касающиеся употребительности отдельных единиц и их длины.